病理学家拥有丰富的词汇,他们可以描述细胞形态的所有细微差别。在他们的世界中,图像和单词都有自然的配对。最近的进步表明,现在可以对机器学习模型进行培训,以学习高质量的图像功能并将其表示为离散信息。这使得自然语言(也是离散的语言)可以与成像旁边共同建模,从而描述了成像内容。在这里,我们介绍了将离散建模技术应用于非黑色素瘤皮肤癌的问题结构域,特别是eme骨内癌(IEC)的组织学图像。通过实施IEC图像的高分辨率(256x256)图像的VQ-GAN模型,我们训练了序列到序列变压器,以使用病理学家术语来生成自然语言描述。结合使用连续生成方法获得的交互式概念矢量的概念,我们展示了一个额外的解释性角度。结果是为高度表达的机器学习系统而努力的一种有希望的方法,不仅可以用作预测/分类工具,而且还意味着要进一步了解我们对疾病的科学理解。
translated by 谷歌翻译
在这项工作中,我们可以比较应用于运输需求建模问题的机器学习算法的性能。航空运输业预测是由于行业的经济和财务方面的规划和管理的重要组成部分。国际民用航空组织规定的航空公司业务中使用的传统方法是利用多元线性回归(MLR)模型,利用成本变量和经济因素。这里,利用人工神经网络(ANN),自适应神经模糊推理系统(ANFIS),遗传算法,支持向量机和回归树进行模型的性能被MLR进行比较。ANN和ANFIS在最低平均平方误差方面具有最佳性能。
translated by 谷歌翻译
针对变压器的神经体系结构搜索(NAS)已用于创建针对某些延迟约束的最新模型。在这项工作中,我们提出了更大,更快的速度,这是一种新颖的量化参数共享NAS,它为8位整数(INT8)量化变压器的架构。我们的结果表明,我们的方法能够产生胜过当前最新技术的BERT模型,即Autotinybert,我们测试了所有潜伏期目标,达到了2.68%的准确性增益。此外,尽管我们技术发现的模型的参数数量比float32的参数数量更大,但由于其参数为INT8,但它们的内存足迹大大较小。
translated by 谷歌翻译
本文着重于基于雷达的同时定位和映射(SLAM)中的有效地标管理。必须进行地标管理,以保持相对于平台姿势估计的估计地标的一致地图。当面对从相同地标和/或动态环境的多个检测到地标可以更改的地标和/或动态环境时,此任务尤其重要。雷达数据的另一个挑战是存在错误检测。因此,我们为Radar Slam Landmark Management提出了一个简单而有效的规则解决方案。假设我们的解决方案中有几个步骤:需要检测并包括新的地标,需要识别和删除虚假地标,并且需要维护地图中注册的地标的一致性。为了说明我们的解决方案,我们在包含固定和固定地标的环境中运行扩展的Kalman Filter Slam算法。我们的仿真结果表明,即使面对虚假检测和来自同一地标的多次检测,提出的解决方案也能够可靠地管理地标。
translated by 谷歌翻译
语境。斑点检测是天文学中的常见问题。一个例子是在恒星种群建模中,其中从观察结果推断出星系中恒星年龄和金属性的分布。在这种情况下,斑点可能对应于原位的恒星与从卫星中吸收的恒星相对应,而BLOB检测的任务是解散这些组件。当分布带来重大不确定性时,就会出现一个困难,就像从未解决的恒星系统的建模光谱中推断出的恒星种群的情况一样。目前没有不确定性检测BLOB检测的令人满意的方法。目标。我们介绍了一种在恒星系统综合光谱的恒星种群建模的背景下开发的不确定性感知斑点检测方法。方法。我们为经典的blob检测方法的经典laplacian方法的不确定性感知版本开发了理论和计算工具,我们称之为ULOG。这确定了考虑各种尺度的重要斑点。作为将ULOG应用于恒星种群建模的先决条件,我们引入了一种有效计算光谱建模不确定性的方法。该方法基于截断的奇异值分解和马尔可夫链蒙特卡洛采样(SVD-MCMC)。结果。我们将方法应用于星团M54的数据。我们表明,SVD-MCMC推断与标准MCMC的推断相匹配,但计算速度更快。我们将ULOG应用于推断的M54年龄/金属性分布,识别其恒星中的2或3个显着不同的种群。
translated by 谷歌翻译
大型和深度电子医疗保健记录(EHR)数据集的可用性有可能更好地了解现实世界中的患者旅行,并鉴定出新的患者亚组。基于ML的EHR数据集合主要是工具驱动的,即基于可用或新开发的方法的构建。但是,这些方法,它们的输入要求以及最重要的是,通常难以解释产量,尤其是没有深入的数据科学或统计培训。这危害了需要进行可行且具有临床意义的解释的最后一步。这项研究研究了使用大型EHR数据集和多种聚类方法进行临床研究的方法进行大规模进行患者分层分析的方法。我们已经开发了几种工具来促进无监督的患者分层结果的临床评估和解释,即模式筛查,元聚类,替代建模和策展。这些工具可以在分析中的不同阶段使用。与标准分析方法相比,我们证明了凝结结果并优化分析时间的能力。在元聚类的情况下,我们证明了患者簇的数量可以从72减少到3。在另一个分层的结果中,通过使用替代模型,我们可以迅速确定如果有血液钠测量值可用,则可以对心力衰竭患者进行分层。由于这是对所有心力衰竭患者进行的常规测量,因此表明数据偏差。通过使用进一步的队列和特征策展,可以去除这些患者和其他无关的特征以提高临床意义。这些示例显示了拟议方法的有效性,我们希望鼓励在该领域的进一步研究。
translated by 谷歌翻译
变压器已成为自然兰格格处理和视觉中许多任务的首选模型。在更有效地进行培训和部署变压器的最新努力已经确定了许多策略,以近似自我发挥作用矩阵,这是变压器体系结构中的关键模块。有效的想法包括各种预先指定的稀疏模式,低级基础扩展及其组合。在本文中,我们重新访问了小波等经典多分辨率分析(MRA)概念,在这种情况下,在这种情况下的潜在价值迄今仍未被逐渐解散。我们表明,基于现代硬件和实施挑战所告知的经验反馈和设计选择的简单近似值,最终在大多数感兴趣的标准中产生了基于MRA的自我注意力方法,具有出色的性能。我们进行了一系列广泛的实验,并证明该多分辨率方案的表现优于最有效的自我注意力建议,并且对短序列和长序列都有利。代码可在\ url {https://github.com/mlpen/mra-witchention}中获得。
translated by 谷歌翻译
细菌感染负责全球高死亡率。感染潜在的抗菌素耐药性,多方面的患者的临床状况会阻碍正确选择抗生素治疗。随机临床试验提供了平均治疗效果估计值,但对于治疗选择的风险分层和优化,即个性化治疗效果(ITE)并不理想。在这里,我们利用了从美国南部学术诊所收集的大规模电子健康记录数据,模仿临床试验,即“目标试验”,并为诊断患有急性细菌的患者开发了死亡率预测和ITE估计的机器学习模型皮肤和皮肤结构感染(ABSSI)是由于金黄色葡萄球菌(MRSA)引起的。 ABSSI-MRSA是一个充满挑战的疾病,治疗选择减少 - 万古霉素是首选的选择,但它具有不可忽略的副作用。首先,我们使用倾向评分匹配来模仿试验并创建随机治疗(万古霉素与其他抗生素)数据集。接下来,我们使用此数据来训练各种机器学习方法(包括增强/Lasso Logistic回归,支持向量机和随机森林),并通过引导验证选择接收器特征(AUC)下的面积最佳模型。最后,我们使用这些模型来计算ITE并通过改变治疗的变化来避免死亡。排出外测试表明,SVM和RF是最准确的,AUC分别为81%和78%,但BLR/Lasso不远(76%)。通过使用BLR/Lasso计算反事实,万古霉素增加了死亡的风险,但显示出很大的变化(优势比1.2,95%范围0.4-3.8),对结果概率的贡献是适度的。取而代之的是,RF在ITE中表现出更大的变化,表明更复杂的治疗异质性。
translated by 谷歌翻译
通过一系列联邦举措和命令,美国政府一直在努力确保美国在AI中的领导。这些广泛的战略文件影响了美国空军美国部(DAF)等组织。DAF-MIT AI加速器是DAF和MIT之间的一项计划,以弥合AI研究人员与DAF任务要求之间的差距。DAF-MIT AI加速器支持的几个项目正在开发公共挑战问题,这些问题解决了许多联邦AI研究的重点。这些挑战是通过公开可用的大型AI-Ready数据集,激励开源解决方案,并为可以激发进一步研究的双重使用技术创建需求信号,来针对优先事项。在本文中,我们描述了正在开发的这些公共挑战以及它们的应用如何促进科学进步。
translated by 谷歌翻译
增强学习(RL)是多能管理系统的有前途的最佳控制技术。它不需要先验模型 - 降低了前期和正在进行的项目特定工程工作,并且能够学习基础系统动力学的更好表示。但是,香草RL不能提供约束满意度的保证 - 导致其在安全至关重要的环境中产生各种不安全的互动。在本文中,我们介绍了两种新颖的安全RL方法,即SafeFallback和Afvafe,其中安全约束配方与RL配方脱钩,并且提供了硬构成满意度,可以保证在培训(探索)和开发过程中(近距离) )最佳政策。在模拟的多能系统案例研究中,我们已经表明,这两种方法均与香草RL基准相比(94,6%和82,8%,而35.5%)和香草RL基准相比明显更高的效用(即有用的政策)开始。提出的SafeFallback方法甚至可以胜过香草RL基准(102,9%至100%)。我们得出的结论是,这两种方法都是超越RL的安全限制处理技术,正如随机代理所证明的,同时仍提供坚硬的保证。最后,我们向I.A.提出了基本的未来工作。随着更多数据可用,改善约束功能本身。
translated by 谷歌翻译